[速報] Guardrails for Amazon bedrockが登場。Responsible AIを生成AIにも。 #AWSreinvent
せーのでございます。 ただいま、AWS re:Invent 2023 keynoteをラスベガス現地にて聞いております。
AWSよりBedrock用の新機能「Guardrails for Amazon bedrock」がリリースされたのでお伝えします。
めちゃめちゃ簡単に言うと?
Bedrockを使って自然言語によるやり取りをする際に、有害なコンテンツや説明を伴いたいトピックに対して、あらかじめガードレールを敷くことができるサービスです。
主な用途
メインはやはり企業がLLMなどを使う際に企業のポリシーと原則に沿った適切で安全に従業員、またはエンドユーザーに生成AIを使わせる、という目的になるでしょう。
通常はこういったフィルタリングやガードレールはあらかじめモデルにわたす際のプロンプトに工夫していたり、レスポンスに対して新しい機械学習モデルをかませて有害なコンテンツを検出する、といった方法が一般的でしたが、今回のこのGuardrails for Amazon Bedrockが出たことで、管理者はより簡単に、より上のレベルで、企業ポリシーを守り、責任あるAIの運用ができます。
コントローラー
Guardrails for Amazon Bedrockは主に
- トピックの拒否
- コンテンツフィルター
- 個人情報の再編集
の2つから成り立ちます。
トピックの拒否
拒否したいトピックや説明が必要なトピックをあらかじめ指定しておくことで、「そのトピックについては説明できません」といった定型的なレスポンスを返させることができます。
コンテンツフィルター
有害なコンテンツ(憎悪、侮辱、性的、暴力など)をしきい値を求めて、管理調整することができます。
個人情報の再編集
氏名、Eメールアドレス、電話番号などの個人情報を再編集したり、入力をブロックしたりできます。
CloudWatchとの連携
Guardrails for Amazon BedrockはCloudWatchと連携しているため、このガードレールに違反したユーザーやそのコンテンツを監視、運用できます。
プレビュー中
このサービスは現在limited preview.となっています。